Analizo al precipaj konsisteroj

Analizo al precipaj konsisteroj (alinomita transformo de Karhunen-Loève (KLT), aŭ transformo de Hotelling) estas matematika teĥniko por plisimpligi la datumojn rezultantaj enkadre de statistiko multvariabla, kaj kiu ebligas evidentigi fenomenojn ial kaŝitajn en la komplekseco de multego da datumoj, determinante kunmetaĵojn da plej rezultivaj datumoj. Tiu metodo ne estis ebla ĝis la ekekzisto de komputiloj, ĉar ĝi bezonas egan amason da kalkulado, sed ekde informadiko, ĝi estas facila kaj fruktdona teĥniko, kiu ekzemple montris el la genaj datumoj de eŭropa loĝantaro la genetikan apartecon de la Eŭskoj de Ebro ĝis Garono, aŭ pruvi, ke la disvastiĝo de agrikulturo ne estis disvastiĝo de novkutimo, sed de gento da agrikulturantoj.

Analizo al precipaj konsisteroj de multvariebla normala distribuo centrata en (1,3) kun norma devio de 3 laŭ la direkto (0.878, 0.478), kaj de 1 laŭ la orta direkto. La montrataj vektoroj estas la ajgenvektoroj de la matrico de varianco- kunvarianco normigitaj per la kvadrata radiko de la dua ajgenvaloro, kaj ŝovitaj al la mezvaloro.

La analizo al precipaj konsisteroj estis inventita de Karl Pearson[1] en 1901. Ĝi estas la plej simpla multvariebla analizo aigenvektorbazita. Ĝi estas nun precipe uzata kiel ilo en esplora datumo analitiko kaj por prognozi modelojn. Eblas fari analizon al precipaj konsisteroj per ajgena malkomponaĵo de matrico de varianco-kunvarianco (aŭ de korelacio) de datenoj, aŭ per singulara valora malkomponaĵo de matrico de datenoj, kutime post centrigado rilate al la mezvaloroj (kaj normigado) de ĉiu elemento de la matrico. Ĝi estas orta transformo, kiu konvertas aron da observaĵoj de eblaj korelaciataj variabloj al aro de valoroj de precipaj konsisteroj (ankaŭ nomataj ĉefaj komponantoj), tielmaniere ke la unua precipa komponanto prezentas la kiel eble plej grandan variancon (ĉar variabloj estas supozitaj sendependaj laŭ tia metodo) laŭ sia direkto, la kiel eble plej malgranda varianco laŭ la orta direkto; ĉiu laŭvica komponanto havas la kiel eble plej granda varianco, sub la trudo, ke ĝi estu orta (t.e. ne-korelaciigita) al la antaŭa komponanto.

Tiu metodo permesas ankaŭ kompresadon de aro da N hazardaj variabloj, al la n-aj (n<N) unuaj komponantoj elektitaj kiel plej bonaj por priskribi la studaton.

  1. (angle) Pearson, K. . “On Lines and Planes of Closest Fit to Systems of Points in Space”, Philosophical Magazine (PDF) 2 (6), p. 559–572.  Arkivigite je 2018-06-22 per la retarkivo Wayback Machine: Pri plej bona alĝustigo de punktaro.

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search